Choix du taux d'élagage pour l'extraction de la terminologie. Une approche fondée sur les courbes ROC

نویسندگان

  • Mathieu Roche
  • Yves Kodratoff
چکیده

Résumé. Le choix du taux d’élagage est crucial dans le but d’acquérir une terminologie de qualité à partir de corpus de spécialité. Cet article présente une étude expérimentale consistant à déterminer le taux d’élagage le plus adapté. Plusieurs mesures d’évaluation peuvent être utilisées pour déterminer ce taux tels que la précision, le rappel et le Fscore. Cette étude s’appuie sur une autre mesure d’évaluation qui semble particulièrement bien adaptée pour l’extraction de la terminologie : les courbes ROC (Receiver Operating Characteristics).

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Classification par voisinages successifs sur des descriptions morphologiques complexes

Résumé. Afin de classifier des descriptions morphologiques issues de bases de connaissances en biologie, nous proposons une méthode de fouille de données incrémentale, interactive et semi-dirigée. Cette méthode est fondée sur la construction itérative du voisinage de la description partielle de l’objet à classer. Nous proposons différents indices de similarité adaptés à la nature complexe des d...

متن کامل

Exploitation de l'asymétrie entre termes pour l'extraction automatique de taxonomies à partir de textes

Résumé. Nous présentons dans cet article une nouvelle approche pour la génération automatique de structures lexicales (ou taxonomies) à partir de textes. Cette tâche est fondée sur l’hypothèse forte selon laquelle l’accumulation de faits statistiques simples sur les usages en corpus permet d’approximer des informations de niveau sémantique sur le lexique. Nous utilisons la prétopologie comme ca...

متن کامل

Recherche par le contenu dans des documents audiovisuels multilingues

RÉSUMÉ. Nous présentons dans cet article une approche basée sur l’utilisation de l’Alphabet Phonétique International (API) pour l’indexation et la recherche par le contenu de documents audiovisuels multilingues. L’approche fonctionne même si les documents contiennent des langues inconnues. Elle a été validée dans le cadre de la compétition « Star Challenge » sur les moteurs de recherche organis...

متن کامل

فایل کامل مجلّه مطالعات زبان فرانسه دو فصلنامه علمی پژوهشی زبان فرانسه دانشکده زبانهای خارجی دانشگاه اصفهان

Tâ ÇÉÅ wx W|xâ Revue des Études de la Langue Française Revue semestrielle de la Faculté des Langues Étrangères de l'Université d'Ispahan Cinquième année, N° 8 Printemps-Eté 2013, ISSN 2008- 6571 ISSN électronique 2322-469X Cette revue est indexée dans: Ulrichsweb: global serials directory http://ulrichsweb.serialssolutions.com Doaj: Directory of Open Access Journals http://www.doaj.org ...

متن کامل

LOCAL-GENERATOR : "diviser pour régner" pour l'extraction des traverses minimales d'un hypergraphe

Résumé. Du fait qu’elles apportent des solutions dans de nombreuses applications, les traverses minimales des hypergraphes ne cessent de susciter l’intérêt de la communauté scientifique et le développement d’algorithmes pour les calculer. Dans cet article, nous présentons une nouvelle approche pour l’optimisation de l’extraction des traverses minimales basée sur les notions d’hypergraphe partie...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2006